Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定!

NT $ 646




【題材涵蓋最全面!一本書掌握資料科學/數據工程必學know-how!】

從大數據到人工智慧世代,其背後蘊含的關鍵技術與理論不脫資料科學、機器學習的範疇。基本上,資料科學需要的背景知識與技能相當的多,通常要會Python程式設計基礎、熟悉相關Python套件和模組的使用;再加上機器學習的基礎就是機率和統計,因此也免不了得學機率和統計知識,可說有一拖拉庫的主題等著你去學,也難怪市面上各主題(程式基礎、統計、套件、機器學習建模...)的專書滿坑滿谷,一時間實在讓人難以消化...

為了降低讀者初學資料科學面對的負擔以及混亂感,我們精心設計了這本入門實戰教本,秉持讓讀者「買一本抵多本」的精神,本書一次涵蓋所有入門必須熟悉的重要題材,同時也將初學資料科學的脈絡梳理清楚。

在章節的安排上,本書從資料取得的網路爬蟲開始,提供一個標準SOP來幫助讀者從網路取得資料;接著說明資料科學必學的Python重量級套件,再接著介紹機率、統計和探索式資料分析的基礎知識,最後進入最熱門的機器學習、深度學習建模主題。

這一連串「取得資料→探索資料→預測分析」是一套完整的資料科學/數據工程實戰訓練,跟著本書掌握這些重要know-how後,就不難看懂網路上眾多資料科學、機器學習專案的Python程式碼和線上教材,甚至參與資料科學、機器學習的網路競賽;希望本書能協助讀者開啟資料科學家/數據工程師的成功之路!
本書特色:
□資料科學三部曲:取得資料→探索資料→預測分析
□一次補足最入門的統計和機率基礎
□Python開發環境與基礎語法快速上手
□從網頁爬蟲、資料清理到資料視覺化,快速完成資料探索的預處理程序
□將清理後的資料存入SQL資料庫,便於日後存取利用
□實踐資料科學的四大套件:NumPy、Pandas、Matplotlib、Seaborn一次掌握
□用Scikit-learn、tensorflow.Keras套件實作最熱門的AI機器學習應用


工程 數據 PYTHON AI 機器學習 分析 SQL 建模 網路 探索 SOP 資料 主題